package com.larry.spark.rdd.transform

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object RDD_Oper_GroupBy {

  def main(args: Array[String]): Unit = {
    //TODO  使用spark

    val conf = new SparkConf().setMaster("local[*]").setAppName("rdd")
    val sc = new SparkContext(conf)

    val rdd : RDD[Int] = sc.makeRDD(List(1,2,3,4,5,6))

    //分组 -> 根据计算结果分组
    //结果为kv
    val rdd1:RDD[(Int, Iterable[Int])] = rdd.groupBy(_ % 2)

    rdd1.collect().foreach(println)

    sc.stop()
  }
}
